在昨天我們有提到四個機器學習的類型,今天我會就監督式學習來講解更多跟監督式學習有關的內容。
首先我們要先複習一下,監督式學習是一種所有資料都被「標註」(label)的學習方法。每個輸入數據都有對應的輸出標籤,這使得機器能夠根據這些標註進行學習,並在未來進行預測時判斷誤差。
過擬合 (Overfitting),過擬合是機器學習中的一個常見問題,指的是模型在訓練數據上表現良好,但在未見數據(測試數據)上表現不佳的情況。這通常發生在模型學習到了訓練數據中的噪音或不必要的細節,導致其對特定數據過度適應。
在監督式學習中可以分成兩大類的演算法,如同上面的優點提到的,第一類是迴歸。
迴歸 (Regression)
迴歸是一種監督學習,其目標是預測連續值或數值。在迴歸任務中,目標標籤是實數,模型學習將輸入特徵映射到連續輸出。迴歸算法廣泛應用於預測股市、房價預測、銷售數據分析等。
而第二種則是分類。
分類 (Classification)
分類是一種有監督的學習,其目標是將數據點分配到預定義的類別或類別中。在分類任務中,目標標籤是離散的,代表不同的類或組。分類算法廣泛應用於垃圾郵件檢測、圖像識別、醫療診斷等。
這些監督學習算法在實際應用中有著廣泛的用途,根據不同的數據和問題選擇合適的算法可以達到最佳的預測效果。
今天稍微說了一些監督式學習的概念,我相信這對於剛接觸的人來說,其實還是蠻抽象的,我明天會以程式的演示來介紹一些算法,讓他以可視化的方式來介紹,並搭配一些比較明確的舉例來介紹,我相信這對於剛接觸的人應該會比較友善一點,明天見囉。